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一 种 基于 模式 匹配 度 的 用 户 移动 规则 挖掘 及 位 置 预测 方法 研究 “ 
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摘 要 : 移动 用 户 的 位 置 预测 可 以 有 效 地 用 于 系统 资源 的 时 空 分 配 ， 提 高 移动 通信 系统 的 资源 利用 率 。 传 统 的 位 置 预 
测 方法 由 于 模式 支持 度 计算 方式 不 合理 ， 存 在 预测 精度 偏 低 的 问题 。 为 此 ， 提 出 了 一 种 基于 模式 匹配 度 的 用 户 移动 规 
则 挖 据 及 位 置 预测 方法 ， 并 将 其 用 于 移动 通信 系统 中 ， 以 基 台 和 履 盖 范围 网 格 为 单元 的 用 户 位 置 预测 。 具 体 包 括 三 个 步 
Jk: 通过 图 的 遍历 挖掘 用 户 移动 模式 、 基 于 用 户 移动 模式 生成 用 户 移动 规则 和 依据 用 户 移动 规则 进行 位 置 预测 。 实 验 
分 析 使 用 10 个 批 次 轨迹 数据 进行 用 户 移动 规则 挖掘 ,结果 表 明 ， 该 方法 挖掘 出 的 用 户 移 动 规则 数 少 、 支 持 度 高 和 置信 
度 高 ， 具 有 高 精度 的 优点 。 
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Method of mining user mobile rule based on pattern matching degree and location prediction. 


-— Zhang Haitao*, Jiang Jifeit, Zhou Huan? 
(a. College of Geographic & Biologic Information, b. College of Communication & Information Technology, Nanjing 
University of Posts & Telecommunications, Nanjing 210003, China) 


Abstract: The location prediction of mobile user is effective for the temporal and spatial allocation of system resources, and it 


can improve the resource utilization of the mobile communication system. The traditional location prediction method has a 


problem of low prediction accuracy due to unreasonable calculation of support. To overcome these challenges, this paper 


presented a method called mining user mobile rule based on pattern matching degree and location prediction. It can predict 
location with the base coverage mesh as the unit for mobile users in mobile communication systems. The detailed procedure 
contained three phases: a) mining user mobile patterns from graph traversal; b) generating user mobile rules from user mobile 
patterns; c) predicting based on user mobile rules. Finally, the conducted experiments on 10 batches of trajectory data 
demonstrate that this method has the characteristics of fewer rules, high support, and high confidence than traditional methods, 
and highly predict accuracy. 


Key words: mobile user; location prediction; pattern matching degree; user mobile rule 


0 az 于 系统 资源 的 时 空 分 配 ， 以 提高 移动 通信 系统 的 资源 利用 率 ， 
降低 移动 用 户 在 基 台 履 盖 范 围 网 格 (mesh) 之 间 切 换 

随 着 计算 机 技术 和 通信 技术 的 发 展 ， 移 动 通信 系统 日 益 普 Chandover) 时 产生 的 系统 延迟 及 掉 线 0 区 ， 最 终 能 够 明显 的 

及 U4 移动 计算 为 人 们 在 任何 时 间 地 点 访问 任何 Tue 提高 移动 通信 网 络 的 服务 质量 。 
供 了 实现 手段 。 它 被 视 为 计算 机 的 热点 领域 B4。 移 动 计算 针对 位 置 预测 国内 外 学 者 提出 了 很 多 解决 方法 。 文 献 
移动 性 、 网 络 多 样 性 等 特点 71。 WE 的 于 的 入 过 [15,16] 提 出 了 一 种 GMM 和 LMM 相 结合 的 方法 ， 使 用 GMM 
通信 系统 , 具有 服务 用 户 庞大 及 数据 服务 类 型 多 样 性 (如 视频 、 与 LMM 4r 3I £ v. Fl P fedi 6 08 ns va ELLE TRERU Je S 18 ns vu H 
声音 、 图 像 等 ) 的 特点 。 为 保障 服务 的 质量 ， 需 要 对 移动 通信 网 格 内 的 移动 模型 ， 并 基于 移动 用 户 的 运动 轨迹 与 移动 模型 的 
系统 中 的 移动 用 户 信息 进行 更 加 有 效 的 管理 。 移 动 性 位 置 管理 匹配， 对 移动 用 户 的 位 置 进行 预测 。 文 献 4Q7Jeung Hoyoung 和 
也 即 移动 用 户 的 位 置信 息 存储 、 更 新 和 预测 是 移动 通信 系统 管 Qing Liu 等 人 利用 Apriori 算法 对 用 户 移动 轨迹 进行 处 理 ， 提 
理 的 主要 内 容 &00。 其 中 ， 移 动用 户 的 位 置 预测 可 以 有 效 地 用 ”取出 用 户 移动 模式 以 此 来 进行 用 户 位 置 预 测 。 文 献 05191 中 ， 
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录用 稿 张海涛 ， 等 : 一 种 基于 模式 匹配 度 的 用 户 移动 规则 挖 气 及 位 置 预测 方法 研究 
Morzy 利用 Aprior 算法 进行 改进 后 生成 关联 规则 ， 后 来 又 依据 i 

e ——  — ,UPM A 包含 UMPB 

改进 的 PrefixSpan 算法 提取 出 用 户 移动 的 频繁 模式 ， 通 过 对 用 suppInc(A, B) =} 1% totDist Q) 
户 的 频繁 模式 进行 处 理 生成 预测 位 置 的 用 户 规则 。 0 , 其 他 

日 是 上 述 方法 存在 共性 问题 是 在 用 于 用 户 位 置 预测 的 模式 定义 3 D 是 存储 所 有 用 户 移动 路 径 即 移动 序列 的 数据 库 ， 
或 规则 其 支持 度 计算 方 法 都 是 采用 简单 的 计数 方式 ， 用 户 位 置 。 B 是 数据 库 D 中 包含 的 一 个 用 户 移动 模式 (UMP)， 则 数据 库 


预测 的 精度 较 低 。 不 能 对 用 户 位 置 预测 的 高 精度 问题 进行 有 效 D 对 B 的 支持 度 定义 为 


处 理 。 而 高 精度 是 保证 移动 通信 系统 为 移动 用 户 高 效 分 配 系统 supp(B) = X suppInc(a, B),o € D (3) 
资源 的 关键 技术 问题 。 因 此 本 文 提出 一 种 基于 模式 匹配 度 的 用 定义 4 定义 MM =<m,m,.. m, m, >，k>1 表示 长 度 为 k 
户 移 动 规则 挖掘 及 位 置 预测 方法 研究 。 的 用 户 移动 模式 C(UMR )， 则 定义 用 户 移动 规则 CUMR ) 为 


aoM, m, > (1<i<k)， 那 么 根据 用 
户 移动 模式 推导 出 的 用 户 移动 规则 有 : 
首先 ， 给 出 相关 方法 涉及 的 定义 。 当 i=l 时 ， R =< m »—«m,,m,,...,m, > ; 

定义 1 G =<V, 巨 > 表示 移动 通信 系统 中 所 有 基 台 覆盖 范 
情形 成 的 有 方向 性 的 ， 无 权重 的 图 结构 。 假 设 
T =< C, C, C.C, > 表示 用 户 在 基 台 和 履 盖 范围 内 的 移动 路 径 即 
移动 序列 ， 每 个 C, 网 格 ， 且 连续 的 网 格 之 间 空 间 邻 近 。 序 列 
数据 库 D 为 < sid,T > 的 元 组 集合 ， 其 中 sid 为 当前 移动 序列 的 
id, T 表示 移动 序列 。 假 设 环 为 根据 序列 数据 库 挖掘 出 长 度 为 
K 的 用 户 移 动 模式 集合 ,对 每 一 个 长 度 为 K 的 用 户 移动 模式 检 
查 其 最 后 一 个 网 格 是 否 在 G 中 有 空间 临近 点 ， 若 有 ， 将 其 添加 conf (M) = 
到 该 用 户 移动 模式 ， 最 终 形 成 长 度 为 KH 的 候选 模式 集合 


R =< m, m,,..., m, > 一 >< m, 


1 “位置 预测 方法 的 基本 原理 


MS 


i=2 时 ， R, =< m,m, > 一 >< m,,m,,..., my > 3 


M 


i=k-1 时 ， R, =< m,n M, >x< m, >; 


其 中 :箭头 (>) 前 面 为 规则 头 部 , 后面 为 规则 尾部 ,定义 该 用 户 
移动 规则 的 置信 度 为 


supp(« m,,m,,...,m, >) 


x100% (4) 


supp(« m, mM,,..., M; > 


Ca 根据 定义 3 定义 的 支持 度 计算 方式 ,计算 出 序列 数据 库 。 I SPP ROTATSITERMERGCRURE. RERRERAAS 
D 对 候选 模式 集合 CL. 的 支持 度 。 设 定 支持 度 赣 值 为 Sum ， conf,, 。 在 产生 所 有 可 能 的 用 户 移动 规则 和 其 对 应 的 置信 度 
去 掉 候 选 模式 集合 C， 中 支持 度 小 于 up 候选 模式 生成 长 。 时 ”对 于 conf (M) > confon 的 用 户 移动 规则 保存 用 来 预测 用 户 
AH Cku F/D UP rin s 5E 
p E p 位 置 。 
度 为 K+1 的 用 户 移动 模式 集合 Lea 。 由 此 逐 层 搜索 得 出 所 有 用 
Sl i i i 定义 5 给 定 用 户 移动 轨迹 P=< m,m, sum >> m 28H 
E! 工 集合 o 


^ f dE d FD. 用户 移动 规则 为 
sacs > 用 户 移动 规则 集合 为 R 则 
RCR. FR 的 头 部 包含 于 P 中 ， 且 头 部 最 后 一 个 元 素 a 与 


定义 2 ”如果 x 和 y 都 是 单独 的 字符 或 者 空格 ，6(x,y) 表 
示 匹 配 x 和 y 后 的 得 分 函数 ， 公 式 定义 为 


R, —€X4,,05,...,0, ><A 


TOE zn (D P 的 最 后 一 个 元 素 m ,重合 。 则 定义 该 用 户 移动 规则 为 匹配 规 


则 ， 并 且 计 算 该 匹配 规则 的 支持 度 与 置信 度 的 和 。 那 么 据 此 定 
义 可 以 从 用 户 移动 规则 集中 筛选 出 匹配 规则 集 ， 并 且 依 据 匹 配 
规则 的 支持 度 与 置信 和 度 和 对 匹配 规则 集 进行 降序 。 假 定 
R, 2«a,0,,..,0; >< 05,4,.40, > 为 经 过 降序 处 理 的 匹配 规则 
集中 首 个 匹配 规则 ， 则 a 即 为 用 户 移动 轨迹 了 的 下 一 个 预测 
位 置 网 格 。 


如 果 S ESPRE RRS HER. sp] REFRE S 
中 的 第 i 个 字符 (第 一 个 字符 串 是 S[1]， 而 不 是 S[O])。 假 设 A 
是 一 条 移动 用 户 在 运动 时 产生 的 以 基 台 覆盖 范围 网 格 (mesh) 
为 单元 的 路 径 (user path based mesh,UPM)〔 简 称 用 户 移动 路 
径 ), UPMB 就 是 包含 在 A 里 的 一 个 用 户 移动 模式 (user mobile 
pattern,UMP)。 对 齐 匹 配 排 列 x' 把 A 和 B 写成 可 能 包含 空格 
的 字符 串 A 和 B o AP: AHB 分 别 从 A' Tig PARE 2 基于 用 户 移动 规则 的 预测 方法 

格 后 就 剩 下 A 和 B。 那么 满足 该 特征 的 一 个 对 齐 匹 配 排列 X ， "E D | PM 
其 对 齐 匹 配 得 分 函数 的 公式 定义 为 8(X) XCTI BUD - 立 置 预测 包含 三 个 阶段 :基于 图 的 遍历 挖掘 出 用 户 移 动 模 
其 中 和 m 分 别 是 p 中 第 一 个 和 最 后 一 个 非 空 属 字符 的 家 引号 。 式 、 从 用 户 移动 模式 生成 用 户 移动 规则 、 基 于 用 户 移动 规则 进 
x ^ H - Y E e P " - 

排列 x 的 对 齐 匹配 得 分 值 实际 上 就 是 及 中 第 一 个 和 最 后 一个 VORRN 

非 空格 字符 之 间 错 误 匹 配 字符 的 个 数 。 因 此 ， 最 佳 的 对 齐 匹配 。 2.1 从 图 的 遍历 中 挖掘 用 户 移动 模式 


AT 


排列 x' 应 具有 最 小 的 对 齐 匹 配 得 分 值 即 最 小 的 模式 匹配 度 ， 该 阶段 包括 三 个 步骤 ， 具 体 过 程 如 下 : 
我 们 将 该 最 小 得 分 称 为 totDist。 用 户 移动 路 径 “UPM) A 对 用 a) 将 研究 的 移动 通信 系统 中 的 所 有 基 台 履 盖 范围 网 格 


DS 


站 移动 模式 CUMPO 的 增 量 支 持 度 〈suppInc) 的 定义 公式 为 (Mesh )， 转 换 成 以 有 方向 性 的 、 无 权重 的 图 (graph) 结构 
G =< V, E > TEME RIA M Aib) 收集 以 基 台 覆盖 范围 网 格 
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(mesh ) 为 单元 的 所 有 
用 户 移动 路 径 
t, TER 


(UPM) 中 的 连续 网 格 元 素 (mesh) 是 否 


序列 数据 库 D 中 挖掘 出 长 度 逐 级 增加 的 用 户 移动 模式 〈 


户 移动 路 径 CUPMO 数据 ， 检 查 每 条 
空间 临 
列 数据 库 D 中 存储 ;c) 设 定 挖掘 用 户 移动 模式 LUMP) 
HI SCEEEE BRE (suppuna) > IEM EYA UMPMining(G, D, supp, ) 从 


UMP) 


ChinaX 
等 : 一 种 基于 模式 匹配 度 的 用 meris ll 


vA FERATI 


75 


张海涛 ， 
2. Foreach L=<l,b,...,l, >,L € L, { 
/# 对 每 个 长 度 为 k HAZIRI (UMP) L, RIIA 1, 在 G 中 的 
AERE sis CB Fe / 
3. N*(L) 2(v|veV,e e E,de(1,,v)) 


集合 
A 
| 


量 支持 度 ， 对 候选 模式 进 和 
第 9、10 行 利 ) 


输出 : 长 度 为 k+l 的 候选 模式 集合 


其 中 ， 使 用 增 量 支持 度 对 候选 模式 进行 支持 度 计 数 、 使 


改口 


PE G 中 查找 所 有 的 节点 v, 其 同 在 G 中 的 节点 具有 有 向 连接 边 e。 


支持 度 闵 值 从 候选 模式 获取 用 户 移动 模式 (UMP)、 使 用 


put 


因此 ， N+(1) 是 用 户 从 出 发 可 能 到 达 邻近 覆盖 区 域 网 格 (Mesh》 的 和 


间 临 近 性 搜索 从 长 度 为 k 的 用 户 移动 模式 (UMP) 得 到 长 度 为 


(k+1) 的 候选 模式 (算法 实现 CandidateGeneration ) 


算法 1 UMPMining() 

输入 : 存储 所 有 用 户 移动 路 径 (UPM) 的 数据 库 D、 有 基 台 覆盖 范围 网 格 
(mesh) 对 应 的 图 结构 ,V 是 6G 中 所 有 节点 集合 ，E 是 连接 G IPTE 
点 V 的 有 向 边 的 集合 、 挖 气 用 户 移动 模式 (UMP ) 的 支持 度 阔 值 wupP ，。 
M. 所 有 的 用 户 移动 模式 (UM) RE L. 

1. C, < 长 度 为 1 的 候选 模式 


E 


3. pag) // 用 户 移动 模式 (UMP) 集合 ， 初 始 值 设置 为 空 
4. While C, 1 


5. ForeachUPM a e Di 

//c 是 长 度 为 k 的 候选 模式 ， 同 时 也 是 
列 

6. C-(s|seC, &&sca) 

7. Foreach c e C(c.countec.countes.suppInc ) // 使 c 的 支持 度 递 


户 移动 路 径 CUPM) @ 的 子 序 


增 
8. }// 得 到 长 度 为 k 的 用 户 移动 模式 (UMP) 
9. Lg -(c|c € C, & &c.count 2 SUPP nin} 


10. L-LOL,/ 6 L, 添加 到 上 中 
// 生 成 长 度 为 k+1 的 候选 模式 
11. c, €— CandidateGeneration(L,,G),vc € C, ., 


c.count — 0 
12. k = k +1} 
13. return L 

法 UMPMining(G, D,supp,,) 中 第 5-8 行 利用 增 
了 支持 度 计数 〈 对 应 定义 2、 定义 3); 
候选 模式 的 支持 度 计数 (c.count) 与 设 定 的 支 


全 


H. rH 


xX , 


TEE BUE (suppa) 的 比较 ， 从 候选 模式 集合 中 得 到 用 户 移动 模 
X (UMP) 和 集合 ; 第 n dy m m m Sx 
CandidateGeneration(L, ,G) ， 该 算法 通过 使 用 空间 临近 性 搜索 
从 长 度 为 k 的 用 户 移动 模式 CUMPO 得 到 长 度 为 (Kk+1) 的 候选 模 
式 。 

算法 2 CandidateGeneration () 

输入 :长 度 为 k 的 用 户 移动 模式 CUMPO. L, 、 所 有 基 台 覆盖 范围 网 格 (Mesh) 
对 应 的 图 结构 G =<V,E >V 是 G 中 所 有 节点 集合 ,E 是 连接 G 中 所 有 节 
点 V 的 有 向 边 的 集合 。 


candidates 。 


， 初 始 值 设置 为 空 


l. Candidates = 人 /候选 模式 集合 


uy 


4. Foreach ve N*(I,) 


POS E ARTE PES rà v， 将 其 添加 为 模式 L 最 后 一 
生成 相应 的 候选 模式 */ 


个 元 素 ， 从 而 


5. C -«I,L, ls V > 


/将 C 添加 到 候选 模式 集合 


candidates 中 


6. Candidates «— Candidates U C 月 


7. return candidates 


2.2 ”从 用 户 移动 模式 生成 用 户 移动 规则 

该 阶段 包括 四 个 步骤 ， 有 具体 过 程 如 下 : 

a) 设 定 挖掘 用 户 移动 规则 CUMRO ) 的 置信 度 阔 值 
(conf )ib) 选择 长 度 大 于 1 的 所 有 用 户 移动 模式 (UMP)， 生 
成 一 系列 的 用 户 移动 规则 (UMR) ;c) 扫描 序列 数据 库 D 中 的 
用 户 移 动 路 径 CUPM) 数据 ， 对 生成 的 系列 用 户 移动 规则 
CUMR )， 进 行 置 信 度 的 统计 计算 ;:d) 按照 设 定 的 置信 度 阔 值 


(conf...) ， 逐 一 比较 生成 用 户 移动 规则 (CUMR) 的 置信 度 ， 从 
而 得 到 满足 条 件 的 用 户 移动 规则 集合 R。 
2.3 ”基于 用 户 移 动 规则 的 位 置 预测 
该 阶段 包括 三 个 步骤 ， 有 具体 过 程 如 下 : 
a) 取 用 于 预测 移动 用 户 位 置 的 、 当 前 的 用 户 移动 路 径 
CUPM) P;b) 设 定 预测 移动 用 户 下 一 步 可 能 到 达 的 基 台 覆盖 范 
E Pj dE ( mesh ) 的 数量 Cm) cO 利用 算法 
MobilityPrediction(P, Rm) 对 移动 用 户 的 下 一 步 位 置 进行 预测 。 
算法 3  MobilityPrediction() 
输入 : 用 户 当 前 的 移动 轨迹 P=< m,m, ma >、 用 户 移动 规则 
CUMR) 集合 R、 预 测 用 户 下 一 步 可 能 到 基 台 覆盖 范围 网 格 〈mesh) 的 
输出 ;预测 到 达 的 基 台 覆盖 范围 网 格 (Mesh) 集合 ，PMeshs。 
1. PMeshs = 人 // 初 始 结果 设置 为 空 
2. k=1 
// 检 查 R 中 的 所 有 规则 
3. ForeachUMR r:Xa,a;,...,a;? —«€a,,.,a, »e R 1 


/*# 找 出 匹配 规则 的 集合 : 如 果 规 则 的 头 部 Chead) 包含 于 P 中 ， 且 规则 
的 头 部 〈head) 的 最 后 一 个 元 素 (a) 与 P 的 最 后 一 
前 所 在 的 网 格 ) 重合 ， 则 该 规则 为 匹配 规则 */ 
4. [f «a,a,,..,a; >C 忆 区 区 ai 5 m, 


个 元 素 (m) CHI 


H pac 


i 
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移动 路 径 
系列 的 匹配 规则 ;第 8 行 按照 匹配 规则 的 支持 度 、 置 信 度 ， 这 
两 个 衡量 规则 有 效 型 的 
的 匹配 规则 中 选择 前 m 
集合 PMeshs ， 其 中 包含 的 者 
测 的 结果 。 


= 


aX ive FHH 


/*# 把 匹配 规则 的 尾部 tail) 的 第 一 个 元 素 ， 以 及 匹配 规则 的 置信 度 与 
支持 度 的 和 《同时 考虑 度量 规则 有 效 性 的 两 个 指标 : supp, conf) 保存 
到 数组 变量 中 */ 

5. TupleArray[k] = (a 


jo Pconf  rsupp) 
6. k=k+1}} 
// 按 照 置信 度 与 支持 度 的 和 ， 对 数组 变量 


7. TupleArray «— sort(TupleArray) 


进行 降序 


8. index -0 

9. while(index « m & &index « TupleArray.length)( 
// 从 数组 变量 中 选择 前 m 个 元 素 

10. PMeshs «— PMeshs O TupleArray[index] 


11. index—index41l ) 
12. Return PMeshs 

其 中 ,算法 MobilityPrediction(P, Rm) 中 第 3-6 行 利 用 用 户 
CUPM) P 与 用 户 移动 规则 CUMRO ) 的 匹配 运算 获取 


间 标 进行 规则 排序 ; 第 9~11 行 从 排序 后 
个 结果 ; 第 12 行 返回 最 终 的 规则 结果 
AmE (Mesh) 即 为 预 


LH 


2.4 实例 分 析 


示 的 9 个 基 台 覆盖 范围 网 格 转换 成 对 应 的 图 结构 ， 并 检查 
所 示 的 所 
动 路 径 (UPM) 


下 面 结合 一 个 例子 ， 介 绍 算法 执行 的 基本 过 程 。 将 图 1 所 


K1 
户 移 动 路 径 (UPM) 数据 ， 并 确定 每 条 用 户 移 
中 的 连续 网 格 元 素 均 是 空间 临近 ， 并 将 表 1 的 


有 的 用 


结果 保存 到 数据 库 D 中 。 


图 1 所 有 基 台 履 盖 范围 网 格 及 其 对 应 的 图 结构 


Bn 


Xl 存储 用 户 移动 路 径 的 数据 库 
D UPM 
1 <7,6,5,0> 
2 <2,3,0,1> 
3 <1,2,3,4,5,7,0> 
4 <5,0,7,0,1> 


设 定 挖掘 用 户 移动 模式 CUMPO Bs E N E 


(supp,, =2) ， 并 使 用 算法 UMPMining0 从 序列 数据 库 D 中 挖 


加 出 长 度 逐 级 增加 的 用 户 移动 模式 UMP) 集合 。 
结果 如 表 2-5 所 示 ，C 表示 候选 模式 集合 ，L 表示 用 户 移 


动 模式 集合 ， 数 字 表 示 长 度 。 


张海涛 ， 等 : 一 种 基于 模式 匹配 度 的 用 户 Shin PAUSI 测 方法 研 
表 2 长 度 为 1 的 候选 模式 集合 和 长 度 为 1 的 用 户 移动 模式 集合 
Cl L1 
CAND SUPP PATTERN SUPP 
<0> 4 <0> 4 
<1> 3 <1> 3 
<2> 2 <2> 2 
<3> 2 «3» 2 
«4» 1 <5> 5 
<5> 5 <7> 3 
<6> 1 
<7> 3 
«8» 0 
表 3 长 度 为 2 的 候选 模式 集合 和 长 度 为 2 的 用 户 移动 模式 集合 
C2 L2 
CAND SUPP CAND SUPP CAND SUPP PATTERN SUPP 
<0,1> 2 <2,1> 0.33 «54» 0 «0,1» 2 
«0,2» 0 <2,0> 07 «535 0 «0,7» 2 
«0,3» 0 «2,3» 2 «50» 2.5 «2,3» 2 
«0,5» 0 «3,2» 0 «5,75 2 «5,05 2.5 
«0,7» 2 «3,0 125 «5,6 0 «5,7» 2 
«0,8» 0 «3,» 05 «76» 1 <7,0> 2.33 
<1,2> 1 <3,4> 1 <7,5> 0.5 
<1,0> 0.17 «70» 2.3 
«1,85 0 «7,85 0 
表 4 长 度 为 3 的 候选 模式 集合 和 长 度 为 3 的 用 户 移动 模式 集合 
C3 L3 
CAND  SUPP CAND SUPP CAND SUPP PATTERN SUPP 
<0,1,2> (0) <5,0,1> (0) <7,0,1> 1 <5,0,7> 2 
<0,1,0> 0 <5,0,2> 0 <7,0,2> 0 
<0,1,8> 0 <5,0,3> 0 <7,0,3> 0 
<0,7,8> 0 <5,0,5> 0 «705» 0 
«0,7,0» 0 <5,0,7> 2 <7,0,8> 0 
<0,7,5> 0 «5,0,8» 0 
«0,7,6» 0 «5,7,8» 0 
«2,32» 0 «5,7,0» 1 
<2,3,0> 1.25 «5,7,5» 0 
<2,3,5> 0.5 <5,7,6> 0 
<2,3,4> 1 
表 5 长 度 为 4 的 候选 模式 集合 
C4 
CAND SUPP 
«5,0,7,8» 0 
«5,0,7,0» 0 
«5,0,7,5» 0 
«5,0,7,6» 0 
根据 表 2~5 的 结果 最 终 得 到 长 度 分 别 为 1，2，3 的 用 户 移 
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动 模式 (UMP) 集合 及 对 应 的 支持 度 ， 如 表 6 所 示 。 «0» —, «1» 52 
表 6 所 有 用 户 移动 模式 (UMP) 集 合 RE 52 
CAND SUPP : CAND SUPP P TRUM 
«0» 4 «0,1» 2 3.1 实验 数据 
SE 3 «0.7» 2 本 文 初始 数据 为 电信 数据 中 的 请 求 位 置 数据 ， 其 通过 60 s 
<2> 2 <2,3> 2 采集 一 次 ， 时 间 范 围 为 24 h。 一 个 用 户 的 请 求 位 置 数据 代表 了 
<3> 2 «5.0» 2.5 该 用 户 移动 过 程 中 经 过 的 基 台 覆盖 范围 网 格 ， 通 过 空间 离散 化 
<5> 5 «5,7» 2 将 用 户 移动 的 网 格 序列 变 为 空间 临近 的 连续 网 格 序列 。 本 文 使 
<7> 3 «7,0» 2.33 用 了 10 个 批 次 轨迹 数据 基本 信息 如 表 10 所 示 。 
<5,0,7> 2 表 10 10 个 批 次 轨迹 数据 基本 信息 
设 定 控 掘 用 户 移 动 规则 (UMR ) f 8 不 同 批 次 用 户 数量 轨迹 点 总 数量 ”轨迹 点 总 数量 去 重 ”移动 轨迹 平均 轨迹 点 数 
(conf, =50 。 从 表 6 中 选择 长 度 大 于 1 的 用 户 移动 模式 1 200 231779 17838 1158 
CUMP)， 生 成 一 系列 的 用 户 移动 规则 CUMR )。 扫描 表 1 中 的 2 201 240375 17455 1195 
用 户 移动 路 径 CUPMO 数据 ， 按 照 定 义 4 对 生成 的 系列 用 户 移 3 200 236833 19522 1184 
动 规则 (UMR)， 进 行 置信 和 度 的 统计 计算 。 4 198 231857 19236 1170 
所 有 可 能 的 用 户 移动 规则 CUMRO 及 置信 度 的 结果 如 表 7 5 202 237104 19021 1175 
所 示 。 按 照 设 定 的 置信 度 阀 值 (confu =50) ， 得 到 最 终 的 用 户 6 201 231732 20130 1153 
移动 规则 CUMRO 如 表 8 所 示 。 7 200 237718 20460 1188 
二 7” 所 有 可 能 的 用 户 移动 规则 (UMR) 8 199 239059 21653 1201 
Rule Conf 9 203 236350 22474 1164 
<0> — <1> 50 10 200 233262 19447 1166 
co <> en " 32 性 能 对 比 实验 
<2> —> <3> 100 通过 前 面 对 传统 预测 方法 研究 发 现 ， 本 文 提出 方法 与 传统 
<5> —> <0> 5 o x 别 点 在 于 支持 度 计 算 方式 不 一 样 ， 为 了 避免 
«5» —> «T» 40 与 传统 方法 逐一 对 比 ， 同 时 使 对 比 更 具有 公平 性 ， 我 们 采用 本 
«T» — <0> 71.61 文 设计 方法 的 基本 框架 ， 设 计 与 传统 的 方法 一 样 支持 度 计算 方 
«5,0» — «7» 80 式 的 挖掘 预测 方法 。 传 统计 算 支 持 度 方式 ， 即 采用 0 或 1 的 度 
<5> — «0,7» 40 量 方法 : 
O 表 8 满足 置信 度 闹 值 的 用 户 移动 规则 (UMR) —€"— [ UPM A && UMP B 
Rule Conf 0, 其 他 
<0> _><1> 50 实验 设 定 挖掘 算法 的 支持 度 闪 值 ,置信 度 冰 值 分 别 为 10%， 
«0» — <7> 50 50%. 
d». <3> 100 在 后 面 的 实验 及 结果 分 析 中 ， 我 们 简称 基于 模式 匹配 度 计 
<5> _><0> 50 算 支 持 度 的 方法 为 相似 化 方法 ， 而 采用 0 或 1 计算 支持 度 的 对 
«T» 2, <0> 71.61 比方 法 为 非 相似 化 方法 。 相 似 化 方法 和 非 相 似 化 方法 挖掘 用 户 
«5,0» —> <7> 80 移动 规则 的 基本 性 能 指标 如 图 2~ 图 4 所 示 ， 从 这 10 个 批 次 可 


获取 用 于 预测 移动 用 户 位 置 的 、 当 前 的 用 户 移动 路 径 ”以 发 现 本 文 设计 的 相似 化 方法 挖掘 的 用 户 移动 规则 数量 少 ， 支 


(UPM)P =< 3,5,7,0 >。 设 定 预测 移动 用 户 下 一 步 可 能 到 达 的 基 持 度 高 ， 置 信 度 高 的 特点 。 数 量 少 是 因为 本 文 方法 重新 定义 了 
台 履 盖 范 围 网 格 (Mesh ) 的 数量 (m=1 )。 利 用 算法 ”用 户 移动 路 径 对 用 户 移动 模式 支持 度 使 得 挖掘 出 的 用 户 移动 模 


ul 


MobilityPrediction(P,R,m) 对 移动 用 户 的 位 置 进 行 预测 。 根 据 表 ” 式 集合 变 少 导致 挖 气 用 户 移动 规则 变 少 。 支 持 度 高 是 因为 相似 
9 得 出 预测 结果 为 7 的 覆盖 区 域 网 格 。 化 方法 挖掘 出 的 用 户 移动 规则 数量 少 。 置 信和 度 均 值 高 是 因为 对 
表 9 用 于 预测 的 用 户 移动 规则 CUMR) 比方 法 〈 非 相似 化 ) 采用 简单 的 0 或 1 的 度量 方法 计算 支持 度 ， 

导致 产生 了 大 量 的 虚假 的 强 规则 。 


Rule Conf+ SUPP 


<5,0> — «7» 82 
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E 60000 4 El 013 | 一 一 相似 化 
8 40000 | . Wg 非 相似 化 
20000 - Man e A 041 ; 
à NC E NC TER ao Rn 
图 2 挖掘 用 户 移动 规则 数量 的 对 比 批 次 
0.18 图 6 挖掘 用 户 移动 规则 召回 率 均值 对 比 
a is ] 人 0.29 
5 un 0.27 ^. 
w Sa Ei 025 
0.13 » Ei 023 一 一 相似 化 
dde 非 相似 化 
0.11 0.21 
0.19 
图 3 挖掘 用 户 移动 规则 支持 度 均值 对 比 123456728910 
批 次 
] 图 7 挖掘 用 户 移动 规则 了 值 均值 对 比 
a 0009) 4 ”结束 语 
a dl : 移动 用 户 的 位 置 预 测 ， 可 以 有 效 地 用 于 系统 资源 的 时 空 分 
m 0 配 ， 成 为 移动 通信 系统 中 资源 管理 的 重要 内 容 之 一 。 预 测 准确 
ed 度 是 位 置 预测 性 能 的 重要 指标 。 但 是 ， 传 统 的 位 置 预测 方法 
| 不 能 有 效应 对 此 类 问题 。 本 文 提 出 一 种 基于 模式 匹配 度 的 用 户 
图 4 挖 据 用 户 移动 规则 置信 度 均值 对 比 移动 规则 挖掘 及 位 置 预测 方法 研究 。 该 方法 通过 定义 度量 用 户 
相似 化 与 非 相似 化 方法 控 气 用 户 移动 规则 预测 指标 对 比如 移动 路 径 (UPM) 与 用 户 移动 模式 《UMP) 匹 配 度 得 分 值 ， 获 


PS 


5-7 所 示 。 可 以 看 出 ， 相 似 化 方法 挖掘 出 的 用 户 移动 规则 县 WAAR CUPMD 与 用 户 移动 模式 (UMP) 的 最 佳 匹配 
有 较 高 的 准确 率 均 值 、 召 回 率 均值 和 了 均值 。 准 确 率 均值 高 说 方法， 从 而 设计 了 一 种 更 加 合理 的 度量 用 户 移动 路 径 CUPMD 
明 通 过 相似 化 方法 挖掘 出 的 用 户 移动 规则 在 用 于 测试 数据 预测 。 ”对 用 户 移动 模式 (UMP) 支持 程度 的 计算 方法 。 通 过 实验 结果 
时 具有 更 高 的 预测 精度 。 召 回 率 均 值 高 说 明 通 过 相似 化 方法 挖 。 表明 :本文 提 出 的 方法 挖掘 出 的 用 户 移动 规则 具有 规则 数 少 、 
昌 出 的 用 户 移动 规则 在 用 于 测试 数据 预测 时 具有 更 多 匹配 到 的 ”支持 度 高 和 置信 度 高 的 特点 ， 在 用 于 预测 数据 时 能 够 具有 更 高 
规则 数量 。F 值 均值 是 准确 率 和 召回 率 加 权 〈 权 值 a=1) 调和 ”的 预测 精度 。 


e 
< 
s 


ul 


平均 ， 这 能 够 反映 出 挖掘 用 户 移动 规则 的 预测 性 能 。F 值 高 说 参考 文献 
明 采用 本 文 设计 的 相似 化 方法 挖掘 用 户 移动 规则 能 够 有 比较 高 。 
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